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Beschreibving 

Betriebsverfahren eines automatischen Spracherkenners zur 
sprecherunabhangigen Spracherkennung von Worten aus verschie- 
denen Sprachen und automatischer Spracherkenner 

Die Erfindung betrifft ein Betriebsverfahren eines automati- 
schen Spracherkenners zur sprecherunabhangigen Spracherken- 
nung von Worten aus verschiedenen Sprachen gemafi Patentan- 
spruch 1 und einen entsprechenden automatischen Spracherken- 
ner gemafi Patentanspruch 6, 

Ftlr die phonembasierte Spracherkennung ist ein Spracherken- 
nungs-Vokabular erf orderlich, das die phonetischen Beschrei- 
bungen aller zu erkennender W5rter umfaBt. Dies ist eine 
Grundvoraussetzung ftir die phonembasierte Spracherkennung. 
Worter warden hierbei durch Phonemfolgen oder -ketten im Vo- 
kabular reprasentiert . wahrend eines Spracherkennungs-Vor- 
gangs wird eine Suche nach dem besten Pfad durch die Phonem-r 
folgen im Vokabular durchgef tthrt . Diese Suche kann beispiels- 
weise mit dem sogenannten Viterbi-Algorithmus er folgen. Bei 
kontinuierlicher Spracherkennung kannen zudem die Wahrschein- 
lichkeiten far Obergange zwischen Wortern modelliert und in 
den Viterbi-Algorithmus einbezogen werden. 

Die phonetischen Umschriften fur die zu erkennenden Worter 
sind die Basis der phonembasierten Spracherkennung. Daher 
stellt sich zu Beginn des Einsatzes eines phonembasierten 
Spracherkenners immer die Frage^ wie derartige phonetische 
Umschriften gewonnen werden konnen. Unter phonetischen Um- 
schriften werden hier die phonetischen Beschreibungen der 
Wbrter aus einem Zielvokabular verstanden. Insbesondere 
stellt sich diese Frage bei Wdrtern, die dem Spracherkenner 
nicht bekannt sind, 

Bekannt sind Mobil- oder Schnurlostelefone, die eine spre- 
cherabhangige Namenswahl ermoglichen. Ein Benutzer eines der 
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artigen Telefons mufi hierzu die im elektronischen Telefonbuch 
des Telefons enthaltenen Eint:rage trainleren, uxn diese spSter 
zur Namenswahl per Sprache nutzen zu kOnnen. Allerdlngs kann 
in der Regel kein anderer Benutzer dieses Feature nutzen, da 
5 die sprecherabhangige Namenswahl nur ftir eine Person geeignet 
ist, namlich fur diejenige, welche die Sprachwahl trainiert 
hat. Um dieses Problem zu umgehen, konnen die EintrMge im 
elektronischen Telefonbuch in phonetische Umschriften umge- 
wandelt werden. 

10 

Zum Ermitteln der phonetischen Umschrift aus einem geschrie- 
benen Wort, beispielsweise einem Telef onbucheintrag/ sind un- 
terschiedliche Ansatze bekannt. Es sei hier beispielsweise 
auf die sogenannten Diktiersysteme, die im allgemeinen auf 

15 einem PC zur Ausfiihrung kommen, verwiesen. Bei derartigen 

Diktiersystemen ist im Normalfall ein Lexikon von typischer- 
weise mehreren 10000 Wortern mit den Zuordnungen von Buchsta- 
benfolgen zu Phonemfolgen hinterlegt. Da ein solches Lexikon 
allerdings einen sehr hohen Speicherplatzbedarf aufweist, ist 

20 es fur mobile Endger^te wie beispielsweise Mobil- oder 
Schnurlostelefone nicht praktikabel. 

Bekannt sind auch Systeme, bei denen die Umsetzung eines Wor- 
tes in dessen phonetische Umschrift regelbasiert. oder durch 

25 speziell trainierte neuronale Netze erfolgt. Diese Verfahren 
besitzen wie das Lexikon den Nachteil, daB festgelegt werden 
mufi, in welcher Sprache die Phonemfolge realisiert werden 
soil- Allerdings konnen insbesondere in elektronischen Tele- 
fonbQchern Namen aus verschiedenen Sprachen vorhanden sein. 

30 Eine Umsetzung ware dann mit dem oben beschriebenen Verfahren 
nicht Oder nur unvollstSndig moglich- 

Daher wurden sogenannte multilinguale Systeme zur Phonemket- 
tenermittlung und Spracherkennung entworfen. Diese Systeme 
35 erlauben die Erzeugung von Phonemketten aus verschiedenen 
Sprachen - 
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SchlieBlich existiert noch eine andere Ldsung: Ein Benutzer 
spricht die Worte in ein Spracherkennungssystem ein, das dar- 
aus automatisch Phonemfolgen generiert. Bei groBen WortschSt- 
zenr aber auch schon bei einigen dutzend Wartern, wie bei- 
5 spielsweise bei einem elektronischen Telefonbuch mit 80 Ein- 
tragen, ist dies ftir den Benutzer nicht mehr akzeptabel. 

Aufgabe der vorliegenden Erf indung ist es daher^ ein Be- 
triebsverfahrens eines automatischen Spracherkenners zur 
10 sprecherunabhangigen Spracherkennung von Worten aus verschie- 
denen Sprachen sowie einen entsprechenden automatischen 
Spracherkenner vorzuschlagen, welche einfach zu implementie- 
ren sind, sich insbesondere zum Einsatz in mobilen Endgerdten 
eignen, and kostengQnstig zu realisieren sind. 

15 

Diese Aufgabe wird durch ein Betriebsverf ahren mit den Merk- 
malen des Patentanspruchs 1 und durch einen automatischen 
Spracherkenner mit den Merkmalen des Patentanspruchs 6 ge- 
last. 

20* 

Der Erfindung liegt im wesentlichen die Idee zugrunde, phone- 
tische Umschriften von wartern jeweils ftir N-verschiedene 
Sprachen zu ermitteln, diese anschlieBend nachzuverarbeiten 
und einer phonerobasierten einsprachigen Spracherkennung zuzu- 

25 ftihren. Diese Vorgehensweise beruht im wesentlichen auf der 

Erkenntnis, dafi ein Benutzer der Spracherkennung nomnalerwei- 
se in seiner Muttersprache spricht. Auch f remdsprachige Wdr- 
ter, beispielsweise Namen, spricht er normalerweise mit einer 
"Mutter sprachenfarbung", also einem Akzent aus, die bzw. der 

30 durch einen sogenannten Muttersprachen-Spracherkenner grob 

modelliert werden kann. Das Betriebsverf ahren geht daher von 
einer als Muttersprache definierten Sprache aus- 

Jede Sprache ISBt sich nun mit unterschiedlichen, der jewei- 
35 ligen Sprache eigenen Phonemen beschreiben. Bekanntermafien 

ahneln sich jedoch viele Phoneme verschiedener Sprachen. Ein 
Beispiel hierfar ist das "p" im englischen und deutschen. 
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Diese Tatsache wird bei der multilingualen Spracherkennung 
ausgenutzt. FQr ein Ensemble von Sprachen wird hier ein ein- 
ziges Hidden-Markov-Mode 11 erstellt/ mit dem simultan mehrere 
Sprachen erkannt werden kSnnen. Allerdings fiihrt dies zu ei- 
5 nem sehr grolien Hidden-Mar kov-Modell^ das eine niedrigere Er- 
kennungsrate als ein einsprachiges Hidden-Markov-Modell be- 
sitzt. Zudem muA bei einer Brweiterung des Ensembles von 
Sprachen vm beispielsweise eine weitere Sprache ein neues 
Hidden-Markov-Modell erstellt werden, was sehr aufwendig ist. 
10 Dies wird mit der Erfindung vermieden. 

Erf indungsgemafi werden in einem erst en Schritt der Eingabe- 
phase zur Erstellung eines Spracherkenner-Vokabulars eines 
Betriebsverfahrens eines automat ischen Spracherkenners zur 

15 sprecherunabhSngigen Spracherkennung von Worten aus verschie- 
denen Sprachen, insbesondere von Erkennung von Namen aus ver- 
schiedenen Sprachen, die phonetischen Umschriften von W5rtern 
jeweils ftir N-verschiedene Sprachen ermittelt, um pro Wort N- 
erste Phonemfolgen entsprechend N-ersten Aussprachevarianten 

20 zu erhalten. In einem zweiten Schritt- werden die Ahnlichkei- 
ten zwischen den Sprachen ausgenutzt. Hierzu wird eine Abbil- 
dung der Phoneme jeder Sprache auf den jeweiligen Phonemsatz 
der Muttersprache implementiert . Ferner wird in einem dritten 
Schritt die implementierte Abbildung auf die im ersten 

25 Schritt ermittelten N-ersten Phonemfolgen fUr jedes Wort an- 
gewandt. Dadurch werden pro Wort N-zweite Phonemfolgen ent- 
sprechend N- zweiten Aussprachevarianten erhalten. Mit dem 
Muttersprachen-Spracherkenner kann dann bereits eine Anzahl 
N-verschiedener Sprachen nach Erstellen eines Spracherkenner- 

30 Vokabulars mit den im vorhergehenden Schritt erhaltenenen N- 
zweiten Phonemfolgen pro Wort fur den Muttersprachen-Sprach- 
erkenner erkannt werden. 

Die Erfindung hat im wesentlichen die folgenden Vorteile: 
35 wahrend ein Look-up-Verf ahren in einem Lexikon bei mobilen 
Endgeraten wegen des groBen Speicherplatzbedarf s scheitert 
und bei der multilingualen Spracherkennung, die fUr einen 
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" satz von Sprachen optimiert wurde, fUr jede neue Sprache neue 
Hidden-Markov-Modelle erstellt und optiiaiert werden massen, 
wird durch die Grapheme/Phoneme-Konversion in mehrere Spra- 
chen gemaJi der Erfindung ein multilinguales System geschaf- 
5 fen, das mit relativ einfachen Mitteln zu implementieren ist, 
sich daher vor allem zum Einsatz in mobilen Endgeraten eignet 
und nicht zuletzt kostengtinstig zu realisieren ist. Fttr die 
Erfindung ist neben der Graphem-zu-Phonem-Umwandlung im we- 
sentlichen nur noch ein Mapping, d. h. ein Abbilden zwischen 

10 den einzelnen Sprachen - wie oben eriautert - erforderlich. 
Die Phonemfolgen-Ermittlung und das anschlieBende Mapping 
bzw. Abbilden laufen normalerweise "offline" auf einem Gerat 
ab, beispielsweise einem Mobiltelef on, einem Personal Digital 
Assistant oder Personal Computer mit entsprechender Software, 

15 und sind daher zeitunkritisch. Die hierfiir benotigten Res- 

sourcen k5nnen in einem langsamen externen Speicher unterge- 
bracht werden. 

Da das mit dem oben beschriebenen Verfahren erstellte Sprach- 

20 erkenner-Vokabular jedoch fOr jedes Wort N-Aussprachevarian- 
ten umfafit, ist der Suchaufwand bei der Spracherkennung grofi. 
Dm ihn zu verringern, kann ein weiterer Schritt in das Ver- 
fahren eingefiihrt werden, der noch vor dem Erstellen des 
Spracherkenner-Vokabulars und nach dem Erzeugen der N-zweiten 

25 Phonemfolgen pro Wort ausgefUhrt wird. In diesem Schritt wer- 
den die N-zweiten Phonemfolgen entsprechend den N-:Zweiten 
Aussprachevarianten jedes Wort bearbeitet, indem jede zweite 
Phonemfolge mittels geeigneter Distanzen, insbesondere der 
Levenshtein-Distanz, analysiert und klassif iziert wird, und 

30 die N-zweiten Phonemfolgen jedes Wortes auf wenige, vorzugs- 
weise zwei bis drei, Phonemfolgen reduziert werden, insbeson- 
dere indem die Aussprachevarianten weggelassen werden, die 
der Aussprachevariante der Muttersprache am wenigsten ahnlich 
sind- Vereinfacht ausgedrUckt werden durch diese Reduzierung 

35 die weniger wichtigen Aussprachevarianten weggelassen, wo- 
durch sich der Suchaufwand bei der Spracherkennung verrin- 
gert . 
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Eine weitere Aufwandsreduktion laAt slch erreichen, indem vor 
dem ersten Schritt eine Sprachidentifikation und -reduktion 
vorgenomxnen wlrd. Im Rahnien dieser Sprachidentifikation wird 
5 ftir jedes zu erkennende Wort die Wahrscheinlichkeit der Zuge- 
h5rigkeit zu jeder der N-verschiedenen Sprachen bestitnmt. An- 
hand des Ergebnisses dieser Sprachidentifikation wird die An- 
zahl der im ersten Verfahrensschritt zu verarbeitenden Spra- 
chen , vorzugsweise auf zwei bis drei verschiedene Sprachen, 

10 reduziert. Diese Sprachreduktion erfolgt vorzugsweise, indem 
die Sprachen mit der geringsten Wahrscheinlichkeit nicht wei- 
terverarbeitet werden. Fur ein bestiramtes Wort kann das Er- 
gebnis der Sprachidentifikation beispielsweise wie folgt lau- 
ten: "Deutsch 55%, UK-Englisch 16%, US-Englisch 14%, Schwe- 

15 disch 3%, Bereits nach diesem Ergebnis kann auf drei 

verschiedene Sprachen reduziert werden, indem Schwedisch weg- 
gelassen, d. h. nicht weiterverarbeitet wird. 

Das Ermitteln der phonetischen Umschriften im ersten Verfah- 
20 rensschritt erfolgt vorzugsweise durch mindestens ein neuro- 
naies Netz- Neuronale Netze haben sich zum Ermitteln phoneti- 
scher Umschriften aus geschriebenen Wort en bew^hrt, da sie 
gute Ergebnisse hinsichtlich der Genauigkeit und vor allem 
Verarbeitungsgeschwindigkeit liefern sowie einfach, insbeson- 
25 dere in Software implementierbar sind. 

Als Muttersprachen-Spracherkenner kann insbesondere ein Hid- 
den-Markov-Modell zum Einsatz koromen, das far die als Mutter- 
sprache definierte Sprache erstellt worden ist. 

30 

Die Erfindung betrif ft ferner einen Spracherkenner zur spre- 
cherunabhangigen Spracherkennung von Worten aus verschiedenen 
Sprachen, insbesondere zur Erkennung von Namen axis verschie- 
denen Sprachen. Hierbei ist eine der verschiedenen Sprachen 
35 als Muttersprache definiert. Der Spracherkenner umfafit 
- einen Muttersprachen-Spracherkenner, 
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- ein erstes Verarbeitungsmodul zum Ermitteln der phoneti- 
schen Umschriften von Wdrtern jeweils fUr N-verschiedene 
Sprachen^ urn pro Wort N-erste Phonemfolgen entsprechend N- 
ersten Aussprachevarianten zu erhalten^ 

- ein zweites Verarbeitungsmodul zum Implement ier en einer Ab- 
bildung der Phonem jeder Sprache auf dem jeweiligen Phonem- 
satz der Mut ter sprache r 

- ein drittes Verarbeitungsmodul zum Anwenden der mit dem 
zweiten Verarbeitungsmodul implementierten Abbildung auf die 
mit dem ersten Verarbeitungsmodul ermittelten N-ersten Pho- 
nemfolgen fur jedes Wort^ wodurch pro Wort N-zweite Phonem- 
folgen entsprechend N-zweiten Aussprachevarianten erhalten 
werden^ die mit dem Muttersprachen-Spracherkenner erkannt 

we r den konnen und 

- ein viertes Verarbeitungsmodul zum Erstellen eines Sprach- 
erkenner-Vokabulars mit den durch das dritte Verarbeitungsmo- 
dul erhaltenen N-zweiten Phoneinfolgen pro Wort ftir den Mut- 
tersprachen-Spracherkenner, 

In einer bevorzugten Ausfuhrungsf orm iimfalit der au.tomatische 
Spracherkenner ein fUnftes Verarbeitungsmodul zum Bearbeiten 
der N-zweiten Phonemfolgen entsprechend den N-zweiten Aus- 
sprachevarianten jedes Wortes. Das funfte Verarbeitungsmodul 
ist derart ausgebildet, dafi jede zweite Phonemf olge mittels 
geeigneter Distanzen, insbesondere der Levenshtein-Distanz^ 
analysiert und klassif iziert wirdr und die N-zweiten Phonem- 
folgen jedes Wortes auf wenige, vorzugsweise zwei bis drei, 
Phonemfolgen reduziert werden. 

Ferner kann der automatische Spracherkenner einen Sprachiden 
tifikator und einen Sprachreduzierer umfassen- Der Sprachi- 
dentifikator ist vor das erste Verarbeitungsmodul geschaltet 
und bestimmt far jedes zu erkennende Wort die Wahrscheinlich 
keit der Zugehdrigkeit zu jeder der N-verschiedenen Sprachen 
Der Sprachreduzierer reduziert die Anzahl der vom ersten Ver 
arbeitungsmodul zu verarbeitenden Sprachen, vorzugsweise auf 
zwei bis drei verschiedene Sprachen, indem die Sprachen mit 
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der geringsten Wahrscheinlichkeit nicht weiterverarbeitet 
werden. Sprachidentif ikator und Sprachreduzierer verringern 
sowohl den Verarbeitungsaufwand des automatlschen Spracher- 
kenners sowohl in der Eingabephase als auch in der Erken- 
5 nungsphase betr^chtlich. 

Vorzugsweise weist das erste Verarbeitungsmodul mindestens 
ein neuronales Netz zxim Ejcmitteln der phonetischen Umschrif- 
ten auf • 

10 

Schliefilich weist der Muttersprachen-Spracherkenner in einer 
bevorzugten AusfUhrtingsform ein Hidden-Markov-Model 1 auf , das 
far die als Muttersprache definierte Sprache erstellt worden 
ist* 

15 

Vorteile und Zweckmaliigkeiten der Erfindung ergeben sich im 
tibrigen aus der nachfolgenden Beschreibung eines Ausf iihrungs- 
beispiels der Erfindung anhand der einzigen Figur- Diese 
zeigt ein schematisches Ablaufdiagraxnm der Eingabephase zur 
20 Erstellung eines Spracherkenner-Vokabulars igem^fi der Erfin- 
dung. 

Es soil die sprecherabh^ngige Namenswahl auf einem Mobiltele- 
fon mit den Namen aus dem Telefonbuch far einen deutschspra- 

25 chigen Benutzer realisiert werden. In dem Telefonbuch befin- 
den sich neben aberwiegend deutschsprachigen Namen auch eini- 
ge f remdsprachige Namen. Ein Umsetzer fur die graphemische 
Darstellung der Namen ist auf die Sprachen Deutsch, Italie- 
nisch, Tschechich, Griechisch, Tarkisch eingestellt, insge- 

30 samt als N =^ 5 verschiedene Sprachen. 

In einem Anfangsschritt SO wird eine Sprachidentif ikat ion der 
zugefUhrten Worte 10 bzw. EintrSge des Telefonbuchs vorgenom- 
men. Genauer gesagt wird jedes einzelne Wort auf die Wahr- 
35 scheinlichkeit der ZugehOrigkeit zu einer der ftinf Sprachen 
analysiert. Wird beispielsweise ein deutscher Name verarbei- 
tet, so wird die Wahrscheinlichkeit far Deutsch sehr hoch 
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sein, ftir die anderen vier Sprachen, namlich Italienisch^ 
Tschechisch^ Griechisch und Ttirkisch dagegen sehr viel nied- 
riger- Anhand der pro Wort ermittelten Wahrscheinlichkeiten 
wird die Sprache mit der geringsten Wahrscheinlichkeit ftir 
die weitere Verarbeitung weggelassen. Das bedeutet, daB im 
nachfolgenden Verarbeitungsgang nur noch vier, anstatt ftinf 
Sprachen verarbeitet werden mttssen. 

In einem ersten Verf ahrensschritt SI wird fttr jedes Wort die 
phonetische Omschrift fUr jede der vier verschiedenen Spra- 
chen ermittelt. Dadurch werden tiXr jedes Wort vier Phonemfol- 
gen entsprechend vier ersten Aussprachevarianten erhalten. 

In einem zweiten Verf ahrensschritt 32 wird anschlieBend eine 
Abbildung der Phoneme jeder der vier Sprachen auf den jewei- 
ligen Phonemsatz der Muttersprache implementiert • 

Diese Abbildung wird in einem dritten Verf ahrensschritt S3 
auf die im ersten Verfahrensschritt SI erhaltenen vier ersten;; 
Phonemfolgen 12 angewandt. Hierdurch werden fUr jedes Wort • • 
vier zweite Phonemfolgen 14 entsprechend vier zweiten Aus- 
sprachevarianten erhalten • Die vier zweiten Phonemfolgen 14 
konnen bereits mit einem Muttersprachen-Spracherkehner er- 
kannt werden. 

Om allerdings den Verarbeitungsaufwand fUr den Sprache rkenner 
weiter zu reduzieren, wird pro Wort jede zweite Phonemfolge 
mittels der Levenshtein-Distanz analysiert und klassif iziert 
(Schritt 54) • AnschlieBend folgt ein ftinf ter Verfahrens- 
schritt S5, in dem die analysierten und klassif izierten zwei- 
ten Phonemfolgen pro Wort auf drei Phonemfolgen reduziert 
werden . 

SchlieBlich wird in einem letzten Schritt S6 ein Spracherken- 
ner-Vokabular mit dem in dem fUnften Verfahrensschritt S5 er- 
haltenen drei zweiten Phonemfolgen pro Wort far den Mutter- 
sprachen-Spracherkenner erstellt. Durch die nochmalige Reduk- 
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tion der Phonemfolgen im ftinften Verf ahrensschritt S5 wird 
also das zu speichernde und wShrend einer Spracherkennung zu 
durchsuchende Spracherkenner-Vokabular merklich reduziert. 
Dies bringt in einer praktischen Anwendung der Spracherken- 
5 nung einerseits den Vorteil eines geringeren Speicherplatzbe- 
darfs und andererseits einer schnelleren Verarbeitung, da ein 
kleineres Vokabular durchsucht werden muft. 

Nach Ablauf des beschriebenen Verfahrens kann der Benutzer 
10 mittels Spracherkennung eine Namenswahl, also den sprachge- 
steuerten Aufruf gespeicherter Rufniairmiern liber den Namen des 
Teilnehmers vornehmen, ohne dafi er den Namen des zu rufenden 
Teilnehmers explizit elnmal vorsprechen, also trainieren, 
mufi. 

15 

Im folgenden wird kurz eriautert, was der Benutzer des Mobil- 
telefons zur Verbesserung der Spracherkennung tun kann. Soll- 
te er einmal feststellen, dafi ein bestiimiter Name nicht gut 
erkannt wird^ kann er das Spracherkenner-Menu seines Mobilte- 

20 lefons aufruf en und dort die Anwendung "Namenswahl" auswSh- 
len. Unter dieser Anwendung kann ihm nun eine Oder auch meh- 
rere M6glichkeiten angeboten werden, um die Spracherkennung 
eines bestimmten Wortes, genauer gesagt eines bestimmten Na- 
mens aus dem elektronischen Telefonbuch des Mobiltelefons zu 

25 verbessern. Im folgenden werden beispielhaft elnige dieser 
MSglichkeiten kurz eriautert: 

1. Der Benutzer kann das schlecht oder gar nicht erkannte 
Wort nochmals in das Mobiltelefon einsprechen und anschlie- 

30 fiend durch den im Mobiltelefon enthaltenen Spracherkenner in 
eine Phonemfolge umsetzen lassen. In diesem Fall werden vor-* 
her automatisch ermittelte Aussprachevarianten ganz oder 
teilweise, je nachdem welche Nahe sie zu der neu ermittelten 
Phonemfolge besitzenr aus dem Vokabular des Spracherkenners 

35 entfernt. 
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2. Alternativ kann sich der Benutzer auf dem Display des Mo- 
biltelefons eine Art Lautschrift des schlecht oder gar nicht 
erkannten Eintrags des elektronischen Telefonbuchs anzelgen 
lassen. Die Art Lautschrift kann der Benutzer dann bei Nicht- 

5 zutreffen, d, h- bei schlechter Obereinstimmung mit seiner 
Aussprache, editieren. Beispielsweise kann durch die automa- 
tische Umsetzung des Eintrags "Jacques Chirac" als Laut- 
schrift "Jakwes Schirack" gespeichert sein. Erscheint nun dem 
Benutzer diese Lautschrift als fehlerhaftr kann er sie mit- 
10 tels seines Mobiltelefons editieren^ beispielsweise zu 

"Schack Schirack". AnschlieBend kann das System dazu die pho- 
netische Beschreibung ermittelt und diese ins Spracherkenner- 
Vokabular neu aufnehmen. Damit sollte die automat ische 
Spracherkennung zuverlassig funktionieren. 

15 

3. SchlieBlich kann der Benutzer durch eine explizite Angabe 
der Sprache^ aus der ein fehlerhaft oder gar nicht erkannter 
Name stammt oder durch explizite Auswahl einer bestimmten 
Sprache ftir einen bestimmten Namen die Erkennung wesentlich 

20 verbessern. In einem derartigen Fall werden alle Aussprache- 
varianten fQr den Namen aus dem Spracherkenner-Vokabular ent- 
ferntr die nicht der explizit angegeben Sprache zugeordnet 
sind. 

25 Die Erfindung kann auch vorteilhaft in anderen mobilen Gera- 
ten auBer einem Mobiltelefon z. B. einem Personal Assistant 
Oder auch einem Personal Computer verwendet^ d. h. eingesetzt 
werden . 



200118580 



12 



EPO ^ Munich 

.17. Jan. £312 

PatentansprQche 

1. Betriebsverfahren eines automatischen Spracherkenners zur 
sprecherunabhSngigen Spracherkennung von Worten (10) aus ver- 
schiedenen Spracheii/ insbesondere zur Erkennung von Namen aus 
verschiedenen Sprachen, das von einer als Muttersprache defi- 
nierten Sprache ausgeht und eine Eingabephase zur Erstellung 
eines Spracherkenner-Vokabulars mit den folgenden Schritte 
aufweist: 

(a) Ermitteln der phonetischen Umschriften von Wdrtern je- 
weils far N verschiedene Sprachen, um pro Wort N erste Pho- 
nemfolgen (12) entsprechend N ersten Aussprachevarianten zu 
erhalten (SI) , 

(b) Implement ieren einer Abbildung der Phoneme jeder Sprache 
auf den jeweiligen Phonemsatz der Muttersprache (S2)^ 

(cl) Anwenden der in Schritt (b) implement ierten Abbildung 
auf die in Schritt (a) ermittelten N ersten Phonemf olgen (12) 
fur jedes Wort/ wodurch pro Wort N zweite Phonemfolgen (14) 
entsprechend N zweiten Aussprachevarianten erhalten werden^ 
die mit einem Muttersprachen-Spracherkenner erkannt werden 
kdnnen (S3) , und 

(d) Erstellen eines Spracherkenner-Vorkabulars mit den im 
•vorhergehenden Schritt erhaltenen N zweiten Phonemfolgen pro 
Wort fUr den Muttersprachen-Spracherkenner (S6) . 

2. Betriebsverfahren nach Anspruch 1, 

ferner gekennzeichnet durch die folgenden^ vor dem Schritt 
(d) und nach dem Schritt (cl) auszuf ahrenden Schritte: 
(c2) Bearbeiten der N zweiten Phonemfolgen (14) entsprechend 
den N zweiten Aussprachevarianten jedes Wortes, indem 
(c21) jede zweite Phonemfolge (14) mittels geeigneter Distan- 
zen, insbesondere der Levenshtein-Distanz, analysiert und 
klassif iziert wird (S4) , und 

(c22) die N zweiten Phonemfolgen jedes Wortes auf wenige, 
vorzugsweise 2 bis 3^ Phonemfolgen reduziert werden (S5). 
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3. Betriebsverfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, dass 

vor dem Schritt (a) elne Sprachidentif Ikation vorgenonunen 
wird, durch die fflr jedes zu erkennende Wort die Wahrschein- 
5 lichkeit der Zugeh5rigkeit zu jeder der N verschiedenen Spra- 
chen bestixnmt wird, und anhand des Ergebnisses der Sprach- 
identif ikation die Anzahl der in Schritt (a) zu verarbeiten- 
den Sprachen^ vorzugsweise auf 2 bis 3 verschiedene Sprachen, 
reduziert warden, indem die Sprachen mit der geringsten Wahr- 
10 scheinlichkeit nicht weiter verarbeitet werden (SO) . 

4. Betriebsverfahren nach einem der Ansprttche 1 bis 3, 
dadurch gekennzeichnet, dass 

das Ermitteln der phonetischen Umschriften in Schritt (a) 
15 durch mindestens ein neuronales Netz erfolgt. 

5. Betriebsverfahren nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, dass 

als Muttersprachen-Spracherkenner ein Hidden-Markov-Modell . 
20 eingesetzt wird, das far die als Muttersprache definierte 
Sprache erstellt worden ist. 

6- Automatischer Spracherkenner zur sprecherunabhclngigen 
Spracherkennung von Worten aus verschiedenen Sprachen, insbe- 
25 sondere zur Erkennung von Namen aus verschiedenen Sprachen, 

wobei eine der verschiedenen Sprachen als Muttersprache defi- 
niert ist, mit 

- einem Muttersprachen-Spracherkenner, 

- einem ersten Verarbeitungsmodul zum Ermitteln der phoneti- 
30 schen Umschriften von Wortern jeweils fur N verschiedene 

Sprachen, um pro Wort N erste Phonemfolgen entsprechend N 
ersten Aussprachevarianten zu erhalten, 

einem zweiten Verarbeitungsmodul zum Implement ieren einer 
TVbbildung der Phoneme jeder Sprache auf den jeweiligen Pho- 
35 nemsatz der Muttersprache, 

- einem dritten Verarbeitungsmodul zum Anwenden der mit dem 
zweiten Verarbeitungsmodul implementierten Abbildung auf die 
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mit dem ersten Verarbeitungsmodul ermittelten N ersten Pho- 
nemfolgen fur jedes Wort, wodurch pro Wort N zweite Phonem- 
folgen entsprechend N zweiten Aussprachevarianten erhalten 
werden^ die mit dem Mutter sprachen-Spracherkenner erkannt 
5 warden konneU/ und 

- einem vierten Verarbeitungsmodul zum Erstellen eines 
Spracherkenner-Vorkabulars mit den durch das dritte Verarbei- 
tungsmodul erhaltenen N zweiten Phonemfolgen pro Wort far den 
Mutt ersprachen-Spracherkenner • 

10 

7. Automat ischer Spracherkenner nach Anspruch €, 
gekennzeichnet durch 

ein fttnftes Verarbeitungsmodul zum Bearbeiten der N zweiten 
Phonemfolgen entsprechend den N zweiten Aussprachevarianten 
15 jedes Wortes, das derart ausgebildet ist^.dass jede zweite 
Phonemfolge mittels geeigneter Distanzen, insbesondere der 
Levenshtein-Distanz^ analysiert und klassif iziert wird, und 
die N zweiten Phonemfolgen jedes Wortes auf wenige^ vorzugs- 
weise 2 bis 3, Phonemfolgen reduziert werden, 

. 20 

8. Automatischer Spracherkenner nach Anspruch 6 Oder 
gekennzeichnet durch 

einen Sprachidentif ikator, der vor das erste Verarbeitungsmo- 
dul geschaltet ist und fCir jedes zu erkennende Wort die Wahr- 

25 scheinlichkeit der Zugeh5rigkeit zu jeder der N verschiedenen 
Sprachen bestimmt, und einen Sprachreduzierer, der die Anzahl 
der vom ersten Verarbeitungsmodul zu verarbeitenden Sprachen^ 
vorzugsweise auf 2 bis 3 verschiedene Sprachen^ reduziert 
werden^ indem die Sprachen mit der geringsten Wahrscheinlich- 

30 keit nicht weiter verarbeitet werden. 

9. Automatischer Spracherkenner nach einem der AnsprUche 6 
bis 8, 

dadurch gekennzeichnet, dass 
35 das erste Verarbeitungsmodul mindestens ein neuronales Netz 
zvaa Ermitteln der phonetischen Umschriften aufweist- 
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10. Automatischer Spracherkenner nach einem der Ansprache 6 
bis 9, 

dadurch gekennzeichnet,. dass 

der Muttersprachen-Spracherkenner ein Hidden-Markov-Modell 
5 aufweistr das fiir die als Muttersprache definierte Sprache 
erstellt worden ist. 

11* Verwendung des Betriebsverfahrens nach einem der AnsprU- 
che 1 bis 5 und des automatischen Spracherkenners nach einem 
10 der Ansprache 6 bis 10 in einem mobilen Gerat wie einem Mo- 
biltelefon. Personal Digital Assistant Oder einem Personal 
Computer . 
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Zusainmenfassung 

Betriebsverfahren eines automatischen Spracherkenners zur 
sprecherunabhangigen Spracherkennung von Worten aus verschie- 
5 denen Sprachen und automat ischer Spracherkenner 

Die Erfindung betrif ft ein Betriebsverfahren eines automati- 
schen Spracherkenners zur sprecherunabhangigen Spracherken- 
nung von Worten (10) aus verschiedenen Sprachen, insbesondere 
10 zur Erkennung von Namen aus verschiedenen Sprachen, das von 
einer als Muttersprache definierten Sprache ausgeht und eine 
Eingabephase zur Erstellung eines Spracherkenner-Vokabulars 
aufweist. 

15 Figur 
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